[小ネタ]Amazon Translate VS Im Translator VS DeepL 日本語訳を比較してみた
どーもsutoです。
エンジニアはいろいろな技術の公式ドキュメント(英語)を見て勉強することが多いと思いますが、手っ取り早く技術を優先して学びたい時に私はツールで日本語訳しながら読んでしまいます。(英語力を鍛える際には和訳能力の向上ばかりににこだわらない方がよいと言われていますが今回のテーマとは別になるので割愛します)
てなわけで翻訳サービスを使ったりするわけですが、翻訳結果によっては解釈に苦しむ日本語になっちゃったりしますよね。(ベンダの資格試験の問題文あるある)
本日は小ネタとしてタイトルにある3つの翻訳サービスを試して一番しっくりくる日本語訳をしてくれるのはどれなのか比較してみたいと思います。
翻訳サービスの紹介
Amazon Translate
- AWSサービスの1つでディープラーニングを利用した翻訳サービス
- 詳しくは公式ページで
Im Translator
- 100以上の言語を翻訳できる拡張機能
- 右クリックメニューから単語や文章、Webページ全体をすばやく翻訳できるのが便利
- 日本語訳はGoogle翻訳とMicrosoft Bing翻訳の2種類を選択可能
- 文章を音声変換できる機能有り
- ダウンロードはこちら Google Chrome拡張機能、Firefoxアドオン
DeepL
- DeepL社が提供しているディープラーニングを使用した翻訳サービス
- Word,PowerPointファイルもドラッグ&ドロップで翻訳可能
- 日本語→英語翻訳では、方言混じりの文章でも高精度な翻訳を行うことが出来るとのこと(参考記事)
- ダウンロードはこちら Google Chrome拡張機能、Firefoxアドオン
試してみる
今回検証する原文は機械学習系の論文から「Putting An End to End-to-End: Gradient-Isolated Learning of Representations(著者: Sindy Löwe, Peter O'Connor, Bastiaan S. Veeling)」のイントロ部分となります。1.Amazon Translate、2.Im Translator(Google翻訳)、3.2.Im Translator(Bing翻訳)、4.DeepLでそれぞれ日本語訳して文章を比べてみます。(カスタム用語等のオプションは使用していません)
"Modern deep learning models are typically optimized using end-to-end backpropagation and a global, supervised loss function. Although empirically proven to be highly successful [Krizhevsky et al., 2012, Szegedy et al., 2015], this approach is considered biologically implausible. For one, supervised learning requires large labeled datasets to ensure generalization. In contrast, children can learn to recognize a new category based on a handful of samples. Additionally, despite some evidence for top-down connections in the brain, there does not appear to be a global objective that is optimized by backpropagating error signals [Crick, 1989, Marblestone et al., 2016]. Instead, the biological brain is highly modular and learns predominantly based on local information [Caporale and Dan, 2008]."
結果の比較
Amazon Translate
"現代のディープラーニングモデルは、通常、エンドツーエンドのバックプロパゲーションとグローバルな教師付き損失機能を使用して最適化されます。実証的に非常に成功していることが証明されているが [Krizhevsky et al., 2012, Szegedy et al., 2015]、このアプローチは生物学的に不確かなものと考えられている。1 つは、教師付き学習では、一般化を保証するために大きなラベル付きデータセットが必要です。対照的に、子供たちは少数のサンプルに基づいて新しいカテゴリを認識することを学ぶことができます。さらに、脳内のトップダウン接続に関するいくつかの証拠にもかかわらず、エラー信号をバックプロパゲーションすることによって最適化されるグローバルな目標はないようである [Crick, 1989, Marblestone et al., 2016]。代わりに、生物学的脳は高度にモジュール化され、主にローカル情報に基づいて学習します [カポラーレとダン、2008]。"
Im Translator(Google翻訳)
"最新のディープラーニングモデルは、通常、エンドツーエンドのバックプロパゲーションとグローバルな監視付き損失関数を使用して最適化されます。経験的に非常に成功していることが証明されていますが[Krizhevsky et al。、2012、Szegedy et al。、2015]、このアプローチは生物学的に妥当ではないと考えられています。 1つは、教師あり学習では、一般化を確実にするために、ラベル付きの大きなデータセットが必要です。対照的に、子供たちは少数のサンプルに基づいて新しいカテゴリを認識することを学ぶことができます。さらに、脳のトップダウン接続のいくつかの証拠にもかかわらず、エラー信号を逆伝播することによって最適化されるグローバルな目的はないようです[Crick、1989、Marblestone et al。、2016]。代わりに、生物学的脳は高度にモジュール化されており、主にローカル情報に基づいて学習します[Caporale and Dan、2008]。"
Im Translator(Bing翻訳)
"現代のディープラーニングモデルは、通常、エンドツーエンドのバックプロパゲーションとグローバルな教師付き損失機能を使用して最適化されています。経験的に非常に成功であることが証明されている[Krizhevskyら、2012、Szegedyら、2015]、このアプローチは生物学的に不可解であると考えられる。1 つめの場合、教師付き学習では、一般化を確実にするために、ラベル付きの大きなデータセットが必要です。対照的に、子供たちは一握りのサンプルに基づいて新しいカテゴリを認識することを学ぶことができます。さらに、脳内のトップダウン接続のいくつかの証拠にもかかわらず、エラー信号をバックプロパパパパ化することによって最適化された世界的な目的はないようです[Crick、 1989、Marblestoneら、2016]。代わりに、生物学的脳は非常にモジュール化されており、主に局所情報に基づいて学習します[CaporaleとDan、2008]。"
DeepL
"現代のディープラーニングモデルは、一般的にエンドツーエンドのバックプロパゲーションと大域的な教師付き損失関数を用いて最適化されている。経験的に非常に成功していることが証明されているが [Krizhevsky et al., 2012, Szegedy et al., 2015]、このアプローチは生物学的に非現実的であると考えられている。例えば、教師付き学習では、一般化を確実にするために大規模なラベル付けされたデータセットが必要となる。対照的に、子供は一握りのサンプルに基づいて新しいカテゴリを認識することを学ぶことができる。さらに、脳内のトップダウン接続を示すいくつかの証拠があるにもかかわらず、エラー信号をバックプロパゲーションすることによって最適化されるグローバルな目的は存在しないようである[Crick, 1989, Marblestone et al., 2016]。その代わり、生物学的脳は高度にモジュール化されており、主に局所情報に基づいて学習する[Caporale and Dan, 2008]。"
他にも他の文章を数種類試しましたが、Google翻訳、Bing翻訳は若干ですが直訳の名残がある文章であるのに対し、Amazon Translator、DeepLは口語に近い表現や自然なカタカナ英語の使用を頑張って導入している印象を受けました。
まとめ
より自然な日本語訳を行えるサービスとしてはDeepLやAmazon Translatorに軍配が上がりそう。とくにSNSでも評判のDeepLに関しては様々な方が検証されていて、Google翻訳を上回っているのではないかと評価されています。
ツールとしての機能面では、無償で多くの機能を利用できるIm Translatorも負けていないと思います。Google翻訳やBing翻訳も決して精度が悪いわけではないのですから。